Qu'est-ce que théorème central limite ?

Le Théorème Central Limite (TCL) est un théorème fondamental en théorie des probabilités. Il stipule, en substance, que la somme (ou la moyenne) d'un grand nombre de variables aléatoires indépendantes et identiquement distribuées (i.i.d.), quelle que soit leur distribution d'origine, tend vers une distribution normale (gaussienne) lorsque le nombre de variables augmente.

Enoncé général :

Soient X<sub>1</sub>, X<sub>2</sub>, ..., X<sub>n</sub> des variables aléatoires indépendantes et identiquement distribuées, ayant chacune une espérance mathématique μ et une variance σ<sup>2</sup> (finies). Soit S<sub>n</sub> la somme de ces variables : S<sub>n</sub> = X<sub>1</sub> + X<sub>2</sub> + ... + X<sub>n</sub>.

Alors, lorsque n tend vers l'infini, la variable aléatoire standardisée :

Z<sub>n</sub> = (S<sub>n</sub> - nμ) / (σ√n)

converge en distribution vers une loi normale centrée réduite (c'est-à-dire une loi normale d'espérance 0 et de variance 1).

Implications et applications :

  • Approximation de distributions : Le TCL permet d'approximer la distribution de la somme (ou de la moyenne) de variables aléatoires, même si l'on ne connaît pas la distribution exacte de chaque variable. C'est particulièrement utile pour des calculs complexes.

  • Inférence statistique : Le TCL est essentiel pour l'inférence statistique, notamment pour la construction d'intervalles de confiance et la réalisation de tests d'hypothèses. Par exemple, la distribution de la moyenne échantillonale est approximativement normale, ce qui permet d'estimer les paramètres d'une population à partir d'un échantillon.

  • Modélisation : De nombreux phénomènes naturels et sociaux peuvent être modélisés par la somme d'un grand nombre de petites influences aléatoires. Le TCL explique pourquoi la loi normale apparaît si fréquemment dans ces contextes.

Conditions d'application :

  • Indépendance : Les variables aléatoires doivent être indépendantes les unes des autres.

  • Identité de distribution : Les variables aléatoires doivent être identiquement distribuées (avoir la même loi de probabilité). Bien que certaines versions du TCL permettent une certaine hétérogénéité, l'hypothèse d'identité facilite la compréhension et l'application.

  • Variance finie : Chaque variable aléatoire doit avoir une variance finie. Si la variance est infinie, le TCL ne s'applique pas nécessairement, et d'autres lois limites peuvent émerger (par exemple, des lois stables).

  • Taille de l'échantillon : "n" doit être "suffisamment grand". La taille minimale de l'échantillon dépend de la distribution d'origine. En général, une taille d'échantillon de n ≥ 30 est souvent considérée comme suffisante pour de nombreuses applications.

Liens importants :